首页> 外文OA文献 >PLDA-based diarization of telephone conversations
【2h】

PLDA-based diarization of telephone conversations

机译:基于PLDA的电话对话区分

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

This paper investigates the application of the probabilistic linear discriminant analysis (PLDA) to speaker diarization of telephone conversations. We introduce using a variational Bayes (VB) approach for inference under a PLDA model for modelling segmental i-vectors in speaker diarization. Deterministic annealing (DA) algorithm is imposed in order to avoid local optimal solutions in VB iterations. We compare our proposed system with a well-known system that applies k-means clustering on principal component analysis (PCA) coefficients of segmental i-vectors. We used summed channel telephone data from the National Institute of Standards and Technology (NIST) 2008 Speaker Recognition Evaluation (SRE) as the test set in order to evaluate the performance of the proposed system. We achieve about 20% relative improvement in Diarization Error Rate (DER) compared to the baseline system.
机译:本文研究了概率线性判别分析(PLDA)在电话对话的说话人二值化中的应用。我们介绍了在PLDA模型下使用变分贝叶斯(VB)方法进行推理的方法,该模型用于在说话人数字化中对分段i矢量进行建模。为了避免VB迭代中的局部最优解,采用了确定性退火(DA)算法。我们将我们提出的系统与著名的系统进行了比较,该系统将k-均值聚类应用于分段i向量的主成分分析(PCA)系数。我们使用来自美国国家标准技术研究院(NIST)2008说话者识别评估(SRE)的汇总通道电话数据作为测试集,以评估所提出系统的性能。与基线系统相比,我们可以实现约20%的相对误差。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号